Worst Case: - finden nicht schnell genug programmierer / personal - Sebastian muss bei Melissa Data bleiben, um seinen Lebensunterhalt zu bestreiten - Verwendung von bestehende Open Source Lösung (z.B. Tensorflow, Moses, Travatar) können nur minimal angepasst sein oder: - müssen mit einer bestehenden, kommerziellen Lösung als unser Backend starten -> http://www.asiaonline.net/EN/LanguageStudio/API/ -> https://kantanmt.com/whatiskantanmt.php -> https://languagecloud.sdl.com/de/translation-toolkit/api-documentation http://shop.sdl.com/products/shop/ http://www.translationzone.com/de/products/sdl-trados-studio/professional/industry-engines-tab3.html#info4 -> https://www.memsource.com/en/pricing#enterprises -> oder andere - Start ohne Autorenprofil Beim Start mit bestehende Open Source Lösung: - Themenspekturm deutscher Sprache kann stark eingeschränkt sein (z.B Focusierung auf Themen Recht, Soziales - aber zb. Wirtschaft kann nicht mehr inkludiert sein, weil der Trainingsaufwand zu hoch ist) - Themenspekturm eingeschränkt, weil nur beschränkte Zeit zum Trainieren der Textdatenbank Ressourcen - keine weiteren monetären Kosten - Extrem hoher Ressourcen, Trainings- und Arbeits- und Zeitaufwand -> Empfehlung: Livegehen mit kommerzielle Lösung und nach Finanzierung Entwicklerteam aufbauen zur Erstellung eigener Software Beim Start mit bestehenden, kommerziellen Lösung: - Nachteil: man muss es bezahlen - Vorteil: Sofort einsetzbar, beliebig skalierbar, via Webschnittstelle ansprechbar, Sofort Multilingual => Schwäche in Stärke umgewandelt!!! Start im Anfang/Mitte Mai mit einer ersten Version: - Nutzen fremder, kommerzieller, bestehender Lösung als Hauptversion - Nutzung des Wortschatz Leipzig als Open Source Lösung für den Austausch Synonym, Annagramme oder "Suche Adjektive zu einem Substantiv" oder "Suche Verben zu einem Substantiv" ( vgl.: http://wortschatz.uni-leipzig.de/html/suche_2.html ) -> sprich: keine Lizenzen zahlen - Speichern alle Aus und Eingaben und Training unseres eigenen auf Open Source basierendes Systems (z.B. Moses, Tensorflow etc) - Sebastian und Gerhard machen Brainstorming zum Autorenprofil und Basti programmiert das dann - Autorenprofil zum Start hat zb. nur 3-5 Kernelemente - Autorenprofil (von Gerhard und Basti) wird nachgeschaltet an die Ausgabe der fremder, kommerzieller, bestehender Lösung - Empfehlung Live gehen und Sangs "Best Case" Business Plan Terminplan erfolgreich einhalten: - Kommerzielle Software nutzen - Autorenprofil mit Gerhard erstellen und Sebastian programmieren lassen - Datenaustausch mittels Uni Leipzig Wortschatz (=Nutzung der Open Source Variante) - Autorenprofil berechnen und Übereinstimmungen erkennen http://www.monkeylearn.com/pricing/ -> Textcategorizierung durchführen, bevor es an die kommerzielle Anbieter, der das passende Textdatenbanksystem hat, gesendet wird